一个小众领域,如何成为人工智能医疗的下一个风口?
编者按:尽管聚焦阿尔茨海默病的AI团队还处于产品打磨期,面临着数据短缺的困境,但人口老龄化会带来预期中的风。
自从人工智能(下称AI)大热以来,赵地已经见过20多个投资人。
赵地是中国科学院计算机网络信息中心“百人计划”入选者、副研究员,回国前在美国哥伦比亚大学医学院从事医学信息领域的研究。“我在这个领域积累很多年,他们都说你怎么不去创业,也去融资几个亿。”他对《财经》记者说。
“几个亿”的调侃源自推想科技的融资。9月21日,该公司宣布完成1.2亿元B轮融资,这是目前国际医学影像人工智能行业内最大规模的单笔融资。一位长期报道AI医疗的媒体人评论称,AI医学影像从此进入B轮融资时代。推想科技专攻肺结节智能筛查领域,被认为是AI医学影像的风口。相对来说,赵地研究的阿尔茨海默病目前属于小众领域。
这在很大程度上,是由于中国对该病症的重视程度不够造成的,呈现就诊率低、诊断率低、治疗率低的“三低”局面。实际上,阿尔茨海默病的患者人数在快速上升,全球每4秒钟就会增加1个阿尔茨海默病患者。根据国际阿尔茨海默病联合会报告,2015年中国阿尔茨海默病患者超过950万,患病人数已居世界第一,且仍在快速增长,2050年将达3000万。
“如今,老龄化、癌症和慢病管理是几个比较重要的话题,未来大的投资机会也会在这三个方向。”据赵地介绍,阿尔茨海默病等老年退行性疾病是北京市科委长期关注的课题,他就从北京市科委获得多项资助。他认为,随着老龄化的问题更加凸显,阿尔茨海默病的人工智能医疗市场将更广阔。
训练医疗大脑
赵地领导的课题组从2015年开始,探索AI在阿尔茨海默病、帕金森氏病等老年退行性疾病领域的应用,目前仍在科研阶段。
比较而言,雅森科技的进入时间要早的多,从2006年就开始研发AI诊断阿尔兹海默病,“从整体的账目上来讲,过去10年,我们都处于一个净投入的状态。”公司CEO陈晖告诉《财经》记者。
阿尔茨海默病,俗称老年痴呆症,是一种发病进程缓慢、随着时间不断恶化的持续性神经功能障碍,该疾病的真正成因至今仍不明确,没有可以阻止或逆转病程的治疗。
然而,如能在患病早期及时发现,就有机会提早干预,以有效减缓病情的恶化。问题是,阿尔茨海默病的症状以及检查指标等的非特异性,较难实现早期诊断。目前,全球各地的研究人员都在开发尽早检测的方法,AI是其中的一种。
临床上,诊断阿尔兹海默病要通过神经心理学测验、血液学检查、结构影像学或功能影像学检查、脑电图等方式综合诊断。其中,核磁成像是诊断阿尔茨海默病的重要一环。
研究人员设想,基于深度学习在图像识别领域的突破,再结合其他信息,进行阿尔茨海默病的诊断,甚至预测。前不久,意大利的研究人员就宣布开发了一种人工智能算法,可以在阿尔茨海默病出现症状之前10年,就从大脑的核磁成像中发现微小的结构变化,给出预警。
据雅森科技研发总监杨士霆介绍,很多已经确诊为阿尔茨海默病的患者,早期的核磁影像并未发现任何异常,因此不能依靠单一的影像来诊断。为此,雅森科技的做法是输入核磁、脑电图和量表三种不同类型的数据,并综合运用机器训练、统计分析和深度学习的方法,找出患者是否患病与输入信息之间的关系。
也就是说,阿尔茨海默病诊断所用到的人工智能,不是传统意义上的深度学习对医学影像的识别,而是要在此基础上,找出多种信息源之间的联系。“许多AI影像公司基于大量数据培训出从图像中找出差异的眼睛,而我们培训了一个大脑,从不同的数据中寻找关系,不停训练,提升准确度。”杨士霆说。
赵地对此的总结是,核磁影像处理加临床决策支持,搜集过往病例,处理数据,得到一个诊断决策支持模型。
这意味着,影像数据仅是AI团队需要搜集数据的一部分,除此之外,临床决策支持模型需要更多医学背景的人来参与。赵地的合作伙伴、来自第四军医大的两位访问学者,如今长驻在北京,与赵地泡在同一个实验室;雅森科技的研发团队也大都具有生物医学工程及医学影像分析背景。
从数据困境中突围
机器学习依赖于海量的数据,有效的数据是AI公司的命脉。
医学上所有影像相关的领域,都值得用AI的方法探索诊断,而决定某个领域发展先进或落后的根本因素,还在于训练数据量的多少。赵地认为,“人工智能算法虽然还在不停发展,但短期内看不到革命性的变化,一个团队与医院的合作,决定了能获得多少数据,有多大的应用市场。”
在常规体检中,胸部CT是其中一部分,产生的海量胸部CT数据吸引着一大批AI公司蜂蛹进入肺结节智能筛查领域。据粗略统计,目前国内有70多家AI医疗公司,其中20多家公司明确宣称,主要关注肺结节人工智能诊断领域。根据依图医疗的数据,截至2017年8月底,其肺结节智能筛查系统的临床数据集超过100万份。
阿尔茨海默病的病例数据难以比肩,这是否会阻碍人工智能诊断技术的前进步伐呢?
对此,杨士霆的看法是,“少,但够用。”
赵地认为,在AI领域,强调几万、几百万例数据意义不大,深度学习技术结合先验规则就能达到一定的准确度。
前述意大利的研究中,用于训练人工智能的核磁图像只有67张,其中38例来自阿尔茨海默病患者,29例来自健康人士。完成训练后,该人工智能对148名受试者的核磁图像进行了测试,检测出轻度认知障碍的成功率达到了84%。
实际上,尽管肺癌是我国发病率最高的癌症,相关数据的储存量很多。但就人工智能可以使用的标记数据而言,一家三甲医院一年提供给合作伙伴的数据大约有2000例左右。
因此,人工智能医疗领域的现状是,大家都缺数据。今年,业内人都将话题聚焦在,如何用较少的有效训练数据达到较好的准确率。
当然,数据仍是驱动AI医疗的最强引擎。赵地表示,AI在阿尔兹海默病领域的应用核心也是数据驱动,数据越多,效果越好,诊断速度越快。
到目前为止,雅森科技搜集了500~700例病例。杨士霆告诉《财经》记者,因为阿尔茨海默病的进展是长期、缓慢的,更多需要的是长期的随访记录,“我们拥有的500~700例数据,也是积累了5年以上的。”
2016年12月,雅森科技完成数千万人民币A轮融资,融资的主要用途之一就是数据收集。
寻找商业模式
在与医院院长的接触过程中,陈晖发现,很多院长倾向于认为数据是医院的资产,他们不想把数据贡献出去让AI公司进行商业化变现,而是希望后者帮助医院挖掘这些数据的价值,使之变成医院自身的诊断能力。
为此,雅森科技选择的商业化路线是从底层的数据质控开始,帮助医院采集符合AI规范的数据,提供医院AI的模型,帮助医院构建自己的AI能力。
今年3月,迅雷创始人、互联网领域投资人程浩撰文称,技术创业者如果只定位做技术提供商,而不直接面向用户或客户提供整体解决方案,未来价值会越来越小,不往上游走风险非常大,甚至是死路一条。
陈晖的观点与此不同,“至少在可预见的未来,医院对于服务的需求是大于产品的需求。”在他看来,深度学习更适合做服务,因为算法产生的壁垒不够强,反而数据是最重要的要素;而相比于数据,多模态模型,即建立不同来源、不同类型数据之间的关联,则难上加难。“在这个领域,未来可能是产品和研发公司主导。”
为此,雅森科技今年将主要提一个新名词:“全流程”,针对脑部疾病,向医院提供从数据质控到诊断的全套解决方案。
除此之外,产品普适化的问题也促使雅森科技选择这种打法。不同医院医疗设备的生产厂商不同、分辨度不同、参数不同等,可能导致实验室中敏感度达99%的产品,实际应用时只有30%左右的敏感度。
到目前为止,雅森科技产品在实验室做过的临床测试结果是:每50例中会有1例系统的判断结果有所偏差,下一步要扩大样本量使得算法模型更加精确、更加具有普适性。陈晖透露,目前在与相关部门沟通,希望基于公司产品定一个临床试验的数据量,“但目前该数据还未知”。
陈晖推测,“可能会要求在不低于2家医院、不少于100或200例规模的临床数据,如果达到要求,就可以认证通过。”目前雅森科技正在产品的调优和定型阶段,该系统要想进驻更多的医院,就需要更多的数据以提升系统的普适性。
一位长期关注AI医疗的投资人告诉《财经》记者,他在考察一个项目时会考虑公司的数据来源是否稳定?是不是足够大?短期内能进多少医院?如果达到这些条件,“即使是个样机,即使没有证书,我也很关注。”
有态度的活粒更有故事
扫一扫: